查看原文
其他

文献研读 | 这是猫还是狗?人脑对物体分类的编码机制

Runhao 鹿鸣Cogn 2022-04-26


按:在生活中,我们通常看到一个物体之后可以很准确的将其进行分类,比如这个动物是猫还是狗。但是当看到一张模棱两可既有点像猫又有点像狗的图片时,大脑是如何做出分类判断的呢?本文介绍一篇刚在预印本平台上线的我导与其他课题组的合作研究,利用fMRI的表征相似性分析探索了额顶区域在视觉分类任务中的编码机制。



大量研究表明,人脑的额顶区域可以灵活地编码各种各样的任务相关信息,是实现人类适应性行为的重要脑基础,这些研究大多解决了“是否能表征”这一问题。但是,目前还不清楚额顶区域对物体的表征方式是否会在不同情况下发生变化,也就是对“如何表征”的问题研究较少。因此,本研究让被试在不同感知难度水平下完成视觉分类任务,利用fMRI的表征相似性分析(RSA)来探索额顶区域究竟是以何种方式对物体进行编码的。

如图1所示,在实验任务中会给被试呈现猫的图片狗的图片(尽管很抽象),要求被试做出判断图片中的是猫还是狗。在研究中,研究者将猫或狗的形状进行不同程度的扭曲(morphing),每张图片会从100%是猫 - 100%是狗之间变化,可以预计,100%猫或狗的时候是最容易做决策的,而50%像猫50%像狗的时候是最难决策的。通过这种操作,研究者就可以根据理论假设来构建相应的表征不相似性矩阵(RDM) 。同时,为了操纵任务的感知难度,研究者通过在视觉刺激上加上高斯噪音来操纵图片的感知难度水平,包括了低感知难度(clean) 和高感知难度(noisy)两种难度。

作者在本研究关注的问题是大脑额顶区域对这些视觉刺激的表征方式究竟是等距编码(equidistant coding)还是聚类编码(cluster coding)。简单说来,如图1A的右侧所示,聚类编码指的是大脑对于相同类别的刺激(如都是猫)的编码会比较相似(距离靠的近),对于不同类别刺激的编码差别比较大(距离较远),这也是代表大脑是对是在类别水平(category level)对物体进行分类的;而等距编码指的是大脑其实是在物体水平(object level)对物体进行分类的,随着图片在感知层面难度的变化,编码层面的距离会相应等距变化。

作者假设,当任务比较难的时候(noisy条件),聚类编码或许是更高效的,因为对于类别进行编码相当于是在低维空间进行表征(只要对类别进行判断,不需要对单个个体的特征进行判断);而在难度低的时候(clean条件),或许等距编码是占主导的(有更多可能关注到物体特征层面的信息)。因此作者假设额顶区域对物体表征的方式或许会随着难度的变化而发生变化

图1 (A)刺激图片示例,上方的是猫猫图,下方的是狗狗图。左侧是两种刺激图片的示例;中间表示的是对难度的操纵,也就是把图片进行一定程度的扭曲,越靠近中间越难(也就是50%猫50%狗的时候);右侧表示两种编码方式的图式。(B)实验流程


在本研究中,对额顶区域兴趣区的划分采用了额顶MD网络(multiple-demand network; MD)的兴趣区(图2);为了验证这两种编码方式哪种更加正确,作者利用了RSA构建了两种假设对应的表征不相似性矩阵(RDM)模型(图3),通过将实验数据的RDM和两种假设RDM进行拟合,可以判断实验结果更支持哪一个假设。

图2  根据HCP数据进行定义的MD网络兴趣区。MD网络是对领域一般性认知任务都起到作用的区域合集,主要覆盖了额顶网络和带状盖区域。


图3  表征相似性分析的模型。左侧是本研究实际数据(顶内沟前部; IP2)构成的RDM;中间是两个假设所对应的理论RDM,上方是聚类编码的模型,下方是等距编码的模型(可以看到数据的RDM和等距模型更像);右侧表述的是后续数据分析的时候利用偏相关可以得到两种编码独有的效应。


我们省略一些直接来看主要结果,偏相关的结果如图4和表1所示。在没有噪声的图片刺激中(即clean trials或难度较低的条件),外侧前额叶和顶叶区域的编码方式均支持等距编码,这与作者之前的假设一致;但是,在有噪声的图片刺激中(即noisy trials或难度较高的条件),顶内沟前部(IP2)和内侧前额叶(8BM)区域依然支持了等距编码,只有IFJp这个区域微弱支持了聚类编码模型,这个结果没有支持作者的假设。相比之下,腹侧视觉皮层非常明显地只在没有噪声的图片中表现出了很强的等距编码模型。

图4  表征相似性分析的结果:展示了各个兴趣区对于两种模型的支持程度(蓝色为聚类编码模型;绿色为等距编码模型)


表1  表征相似性分析偏相关的具体结果:展示了各个兴趣区对于两种模型的支持程度(r为相关系数,BF10为贝叶斯因子,通常来说,至少大于3被认为是存在支持性证据)。其中,前测顶内沟区域(IP2)在两种条件下都表现出了很强的支持等距编码的证据。


从本研究结果而言,顶内沟前部区域(aIPS; IP2)似乎在感知难度高和低的条件下都对于视觉物体分类起到了至关重要的作用。这也说明,无论难度是否变化,该区域的编码方式似乎并没有发生转变,始终更倾向于等距编码。等距编码模型实际上说明该区域可能加工了更为具体的单个物体信息,甚至是特征水平的信息。此外,aIPS的编码与行为表现存在关联(图4中的散点图),当aIPS表现出越强的等距编码时,个体完成任务时的猜测可能性越低。


总结一下,本研究利用了表征相似性分析(RSA)探索了额顶区域的对物体分类的编码方式。结果表明额顶区域似乎更倾向表征特征水平的刺激信息,在分类任务时对单个物体进行加工而非对于类别信息进行加工(支持等距编码模型)。特别地,顶内沟前部区域在不同难度的分类任务中都表现出了相似的重要作用。



论文原文:Wisniewski, D., González-García, C., Formica, S., Woolgar, A., & Brass, M. (2021). Adaptive coding of stimulus information in human fronto-parietal cortex during visual classification  BioRxiv. doi:10.1101/2021.11.22.469511



感谢支持!欢迎点赞、转发、分享!




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存